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Verfahren zur Bestimmung der Lage von Textzeilen bei 
Texterkennungsauf gaben 

Die Erfindung betrifft ein Verfahren zur Bestimmung der 
Lage von Textzeilen bei Texterkennungsauf gaben . 

Bei der automatischen Erkennung von Texten, d,h, bei der 
Umwandlung der grafischen Information eines Dokumentes in 
Textzeichen, die mittels elektronischen Textverarbeitungs- 
programmen weiterverarbeitet werden konnen, ist eine 
wesentliche Voraussetzung ftir einen erf olgreichen 
Erkennungsvorgang die genaue Bestimmung der Lage und der 
Grofie der einzelnen Zeichen. Voraussetzung dafiir ist 
wiederum die Kenntnis der Lage und der Malie der Textzeilen. 



Bei handgef iihrten Lesevorrichtungen kommt es liberdies zu 
einem nichtlinearen Verlauf der Textzeilen in dem erfafiten 
Bildausschnitt . Hier besteht die Notwendigkeit , den Verlauf 
einer Textzeile zu bestimmen. 

Der Erfindung liegt daher die Aufgabe zugrunde, ein 
Verfahren anzugeben, mit dem Lage und Verlauf von 
Textzeilen bestimmt werden konnen. 

Dies geschieht erf indungsgemafi mit einem Verfahren der 
eingangs genannten Art, bei dem die Helligkeitsverteilung 
eines erfafiten Bildausschnittes entlang der Vertikale 
ermittelt wird und diese Helligkeitsverteilung gefiltert 
wird, bei dem Maximiamwert und Minimumwert der solcherart 
erhaltenen Funktion ermittelt werden und auf der Grundlage 
dieser Extrema Schwellwerte berechnet werden, die als 
Grundlage fur die Unterscheidung zwischen Textzeile und 
Zeilenzwischenraum dienen. Das erf indungsgemaBe Verfahren 
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ermoglicht die Feststellung der Zeilenlage und Hohe mit 
geringem Aufwand und damit sehr schnell, sodafi diese 
Information unmittelbar erhalten wird wodurch ein schneller 
Erkennungsvorgang ermoglicht wird. Dies ist besonders bei 
Lesevorrichtungen von Bedeutung, die nur begrenzte 
elektronische Speicher zur Verfugung haben und deshalb eine 
rasche Umsetzung der speicherintensiven Bildinf ormation in 
Textinf ormation noch wahrend der Bildaufnahme erfordern. 

Vorteilhaft ist eine Ausgestaltung des Verfahrens in der 
Weise, dal3 ein Zeilenzwischenraum dann festgestellt wird, 
wenn die Funktion eine Kombination eines Maximums mit einem 
Minimum aufweist, bei der das Minim\jm einen Wert kleiner 
als Funktionsminlmum + Anzahl der Bildpunkte uber die 
Brelte des Bildausschnittes/15 -f der Bildpunkte 

uber die Brelte des Blldausschnlttes/15 * Funktlonsmaxlmum/ 
Anzahl der Bildpunkte uber die Brelte des Blldausschnlttes 
aufweist und der Abfall der Funktionswerte nach dem Maximum 
einen Wert grofier (Funktlonsmaxlmum - Funktionsminlmum) / 2 
aufweist. Diese Ausgestaltung hat sich in der Praxis durch 
sehr gute Ergebnisse bewahrt. 

Ebenfalls vorteilhaft ist eine weitere Ausgestaltung des 
Verfahrens in der Weise, dafi zur Feststellung des linken 
Rands der Textzeilen vor der Bestimmung der Lage der 
Textzeilen die Helligkeitsverteilung eines erfaBten 
Bildausschnittes entlang der Horizontale ermittelt wird und 
die solcherart erhaltene Funktion den Zeilenbeginn durch 
einen sprunghaften Anstieg des Funktionswertes darstellt. 
Damit ist der Zeilenbeginn auf einfache Weise mit geringem 
Aufwand zu ermitteln. Weiterhin kann fur die Ermittlung der 
Lage der Textzeilen gewahrleistet werden, dal3 dabei nur 
Bilder berlicksichtigt werden, die tatsachlich Textzeilen 
enthalten und ein Benutzerf ehler wie z.B, das Ansetzen des 
Lesestiftes zu weit links von dem Zeilenbeginn die 
Zeilenermittlung nicht beeinflulit. 
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Gunstig ist es, wenn nach der erstmaligen Feststellung der 
Lage einer Zeile der weitere Verlauf derselben durch 
Auswertung der Information uber die erkannten Textzeichen 
ermittelt wird* Durch die Auswertung des Ergebnisses der 
Zeichenklassif ikation ist eine besonders genaue Bestimmung 
des Zeilenverlauf s moglich . 

Die Erfindung wird anhand von 2 Figuren naher erlautert. 
Es zeigen beispielhaf t : 

Fig. 1 einen Textausschnitt wie er typisch von einer 
handgeftihrten Lesevorrichtung erfalit wird, sowie das daraus 
ermittelte Hystogramm und 

Fig. 2 das gefilterte Hystogramm mit den eingetragenen 
Parametern zur Beurteilung des Bildes, 

Der Ablauf des erf indungsgemaJien Verfahrens ist wie folgt: 
Zu dem erfafiten Bildausschnitt UB wird ein Zeilenhistogramm 
f (y) ermittelt. Dabei werden zu jeder Zeile die Werte aller 
Bildpunkte dieser Zeile (0 fur Weili und 1 fur Schwarz) 
aufsummiert. Ergebnis ist eine Funktion f (y) mit 

mdth-l 

f{y)= Y^BlackPixel) ^^bei 

y den Zeilenindex des Bildes bedeutet 

Width Breite (Spaltenanzahl ) des Bildausschnittes 

angibt . 

Diese Funktion hat bei Vorliegen eines Textes einen 
typischen Verlauf wie er beispielhaft in Fig, 1 dargestellt 
ist . 

In einem weiteren Schritt erfolgt eine Filterung gemaJi 

f;(/(3/+o*G(o) 
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mit 

y Index im Zeilenhistogramiti 

G Gewichtung entsprechend einer exponentiellen 

Glattungskurve 
i Index der Glattungskurve 

Wahrend des Filtervorganges werden auch der absolute 
Maximumwert Valuemax d.h, die Anzahl der schwarzen 
Bildpunkte (Black Pixel) der dunkelsten Zeile und das 
absolute Minimum Valuemin d. h, die Anzahl der schwarzen 
Bildpunkte (Black Pixel) der hellsten Zeile ermittelt, 

Aus diesen beiden Werten werden Parameter fur die 
Beurteilung des Bildes abgeleitet. Diese sind: 

Gruhenlimlt = (Valuemax - Valuemin) / 2 

mindestens aber Anzahl der Bildpunkte uher die Breite des 
Bildausschnittes/30 

Minimarand = Valuemin + Anzahl der Bildpunkte Uber die 
Breite des Bildausschnittes/15 

hochstens aber 2'^Anzahl der Bildpunkte fiber die Breite des 
Bildausschnittes/15 

Minima schwelle = Minimarand + ( 2* Anzahl der Bildpunkte 
uber die Breite des Bildausschnittes/15 * (Valuemax/Anzahl 
der Bildpunkte uber die Breite des Bildausschnittes ) ) 
hochstens aber 3-*^ Anzahl der Bildpunkte uber die Breite des 
Bildausschnittes/15 

Anhand der Funktion f ' (y) und der ermittelten Schwellwerte 
wie sie beispielhaft in Fig. 2 dargestellt sind, wird nun 
das erfaI3te Bild UB hinsichtlich des Vorliegens von 
Textzeilen und Zeilenzwischenraumen beurteilt* 



Dazu wird der Kurvenverlauf darauf untersucht, ob Werte 
vorliegen, die geringer als der Parameter Minima schwelle 
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sind. 1st dies der Fall, dann wird der betroffene Bereich 
als giiltiges Minimum und damit als moglicher 
Zeilenzwischenraum qualif iziert . 

Ein tatsachlicher Zeilenzwischenraum liegt jedoch nur dann 
vor, wenn durch ein angrenzendes Maximum mit einer gewissen 
Auspragung das Vorhandensein einer Textzeile angezeigt 
wird. Diese gultigen Maxima sind durch ein anschlieliendes 
Absinken des Kurvenwertes um einen Betrag > Grubenlimit 
def iniert . 

Das Zusammentref f en eines gultigen Maximums mit einem 
gultigen Minimum kennzeichnet den Obergang von einer 
Textzeile zu einem Zeilenzwischenraum. Zur genauen 
Bestimmung dieses Oberganges dient der Parameter 
Minimarand. 

Der Punkt in dem die Kurve zwischen einem gultigen Maximum 
und einem gultigen Minimum diese Schwelle schneidet, wird 
als Zeilenkante festgelegt. 

Zur Bestimmung des linken Randes einer Zeile wird ein 
Spaltenhistogramm gemaJJ 

Heighf-\ 

X Spaltenindex des Bildausschnittes 

Height . . . .Bild-Hohe 

erstellt, in Worten die Farbinf ormation der Bildpunkte 
jeder Spalte des erfaJSten Bildausschnittes wird 
aufsummiert. Der linke Textrand ist (bei Vorhandensein 
zumindest einer Zeile) durch einen sprunghaften Anstieg des 
Funktionswertes f (x) def iniert. 

Die Nachfilhrung der Zeilen, d.h. die Information iiber den 
weiteren Verlauf der Zeilen, die besonders bei 
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handgeftihrten Lesevorrichtungen aufgrund der bei diesen 
auftretenden Schwankungen von Bedeutung ist, erfolgt auf 
der Grundlage der Position der erkannten Zeichen. 

Dazu werden die erkannten Zeichen in folgende GroJiengruppen 
eingeteilt : 

Kleine Zeichen (z.B, 'a') 0, 7*Zeilenhohe 

GroJJe Zeichen (z.B. 'A' , ' g' ) Zeilenhohe 

tJbergroJie Zeichen (z.B, M\'j') Zeilenhohe+0, 3*Zeilenhohe 
(Unterlangen) 

Sonderzeichen: die Zeichen lassen sich von der GroJJe nicht ' 
eindeutig zuordnen 

Fiir die Ermittlung der neuen Textzeilenunterkante werden 
folgende Zeichengruppen unterschieden : 

Baseline-Zeichen (z.B, ^A' ,^ • ' ) : die Zeichenunterkante 
entspricht der Textzeilenunterkante, unabhangig von der 
GroBe des Zeichens; 

Unterlangenzeichen (z.B. ^g','[^): die Zeichenunterkante 
entspricht der Unterlangengrenze, unabhangig von der Grolie 
des Zeichens ; 

Sonderzeichen: diese Zeichen lassen sich beztiglich ihrer 
Unterkante nicht eindeutig zuordnen. 

Auf der Grundlage dieser Zuordnungen und einem im Zuge des 
Klassif ikationsverf ahrens erhaltenen Wahrscheinlichkeits- 
wert G betreffend die korrekte Klassif izierung des Zeichens 
wird nun die neue Zeilenhohe Height wie folgt ermittelt: 



G = Wahrschew/ichkeit'^CYC^MAX^WElGm' 

C YC_MAX_EXTRPAR -1 

^ OldHeight\i] + NewHeight * G 



Height = 



CYC MAX EXTRP AR + G 
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G Gewichtung der aus dem aktuellen 

Zeichen abgeleiteten Zeilenhohe 

Wahrscheinlichkeit Wahrscheinlichkeit der korrekten 

Zeichenklassif ikation (Wertebereich zwischen 0 und 1) 
CYC_MAX__WEIGHT Maximale Gewichtung der neuen 

Zeichenposition (z.B.: 5) 

Height Nachgefiihrte Zeilenhohe 

( Gr oBbuchs t abenhohe ) 

CYC_MAX_EXTRPAR GroJie des Ringpuffers ftir die 

Mittelung (z.B.: 3) 

OldHeight [ ] Ringpuf f er 

NewHeight Aus aktuelleiti Zeichen abgeleitete 

Zeilenhohe (Groiibuchstabenhohe) 

i Index im Ringpuffer 

Die Eritiittlung des Verlaufs der Textzeilenunterkante 
erfolgt gemafi : 

G = [wahrscheinlichkeit -h cyC_MA^_ WEIGHT j *CYC_MAX_ WEIGHT 

Oldlncrease + New Increase * G 
Increase = ; — — 

Increase * DeltaX + 50 



Base - New Base ■ 



100 



G Gewichtung der neuen Zeichenposition 

Wahrscheinlichkeit Wahrscheinlichkeit der korrekten 
Zeichenklassif ikation 

CYC_MAX_WEIGHT Maximale Gewichtung der neuen 

Zeichenposition (z.B.: 5) 

Increase Nachgefiihrte aktuelle Steigung der 

Baseline in % 

Oldlncrease Vorherige Steigung der Baseline in % 

Newlncrease Aus Postition des aktuellen Zeichens 

errechnete Steigung der Baseline in % 
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Base Nachgefiihrte Baselineposition (gerundet 

auf ganzzahligen Wert) 

NewBase Aus Position des aktuellen Zeichens 

errechnete Baselineposition 

DeltaX X-Abstand im Image der beiden 

Mittelpunkte der zuletzt extrahierten Zeichen 

Die 'Increase' wird durch das Plausibilitatslimit 
CYC_MAX_ZEILENVERSATZ (im Pocket Reader: 15%) limitiert. 
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Patentanspruche 

1) Verfahren zur Bestiininung der Lage von Textzeilen bei 
Texterkennungsauf gaben, dadurch gekennzeichnet/ dafi die 
Helligkeitsverteilung eines erfaliten Bildausschnittes 
entlang der Vertikale ermittelt wird und diese 
Helligkeitsverteilung gefiltert wird, daJi Maximumwerte und 
Minimiimwerte der solcherart erhaltenen Funktion ermittelt 
werden und auf der Grundlage dieser Extrema Schwellwerte 
berechnet werden die als Grundlage fiir die Unterscheidung 
zwischen Textzeile und Zeilenzwischenraum dienen. 

2) Verfahren nach Anspruch 1, dadurch gekennzeichnet, daii 
ein Zeilenzwischenraum dann festgestellt wird, wenn die 
Funktion eine Kombination eines Maximums mit einem Minimum 
aufweist, bei der das Minimum einen Wert kleiner als 

Funktionsminimum -h Anzahl der Bildpunkte Uher die Breite 
des Bildausschnittes/15 + der Bildpunkte uher die 

Breite des 'Bildausschnittes/15 * Funktionsmaximuih/Anzahl 
der Bildpunkte uber die Breite des Bildausschnittes 
aufweist und der Abfall der Funktionswerte nach dem Maximum 
einen Wert groJier (Funktionsmaximum - Funktionsminimum) / 2 
aufweist . 

3) Verfahren nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, dali zur Feststellung des linken Rands der 
Textzeilen vor der Bestimmung der Lage der Textzeilen die . 
Helligkeitsverteilung eines erfafiten Bildausschnittes 
entlang der Horizontale ermittelt wird und die solcherart 
erhaltene Funktion den Zeilenbeginn durch einen 
sprunghaften Anstieg des Funktionswertes darstellt. 

4) Verfahren nach einem der Anspriiche 1 bis 3, dadurch 
gekennzeichnet, dafi nach der erstmaligen Feststellung der 
Lage einer Zeile der weitere Verlauf derselben durch 
Auswertung der Information uber die erkannten Textzeichen 
ermittelt wird. 
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Zusammenf assung : 

Es wird ein Verfahren zur Bestimmung der Lage von 
Textzeilen bei Texterkennungsauf gaben angegeben, bei dem 
die Helligkeitsverteilung eines erfaJJten Bildausschnittes 
entlang der Vertikale erinittelt wird und diese 
Helligkeitsverteilung gefiltert wird, bei dem Maximiomwerte 
und Minimumwerte der solcherart erhaltenen Funktion 
ermittelt werden und auf der Grundlage dieser Extrema 
Schwellwerte berechnet werden, die als Grundlage f iir die 
Unterscheidung zwischen Textzeile und Zeilenzwischenraum 
dienen. 

Das Verfahren ist besonders vorteilhaft bei handgefiihrten 
elektronischen Lesevorrichtungen einsetzbar . 
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